1.preliminaries
要如何選定特徵與要做甚麼樣的分類
step1:要先定做怎樣的分類
step2:給定資料特徵 --> 自動分類(先'教'電腦之後才測試準確度)
step3:電腦的學習方式(如:提供正確答案的資料-->supervised learning)
step4:在使用不是訓練資料來測試學習效果
2.General approach to solving a classification problem
列舉資料型態 --> 訓練資料 --> 分類演算法 --> 使用測試資料來訓練模型
使用以下的分類方式來測試
Rule-based Methods
Nearest-Neighbor classifiers
Bayesian Classifiers
3.Decision tree induction
使用訓練資料的分支條件作為依據,相異性越大越好
如:Hunt’s Algorithm
使用以下的評估方式來觀察模型訓練效果
Evaluation
Confusion matrix
Accuracy
Error Rate
常見的演算法:
Greedy strategy:是一種在每一步選擇中都採取在當前狀態下最好或最佳,而希望導致結果是最好或最佳的演算法。如:Travelling salesman problem